1
チャットボットを超えて:自律型エージェントのアーキテクチャ
EvoClass-AI005第5講義
00:00

受動的なAI利用から能動的なAIオーケストレーションへの移行へようこそ。"デジタル従業員"を理解するには、まず標準的なチャットボットと自律型エージェントの違いを明確にする必要があります。従来のLLMのやり取りは反応型であり、単純な入力 → 出力パターンに依存していますが、自律型エージェントは次の式で定義される再帰的ループ内で動作します:

$$ \text{目標} + \text{推論} + \text{ツール} = \text{成果} $$

1. LLMを中央処理ユニットとして

このアーキテクチャでは、大規模言語モデル(LLM)が「脳」またはCPUとして機能します。核心的な論理と言語能力を提供しますが、従業員として機能させるためには、持続性と実行を可能にするフレームワークが必要です。

2. エージェントアーキテクチャの三本柱

この脳が効果的に機能するためには、三つの柱に依存しています:

  • 計画:複雑な目標をサブタスクに分解すること。
  • 記憶:過去の相互作用や長期データからの文脈を保持すること。
  • 行動:ツールを通じてデジタル世界でのタスクを実行すること。

私たちはもはや単なるプロンプト入力ではなく、環境を認識し、エラーが発生した際に自己修正できるシステムを設計しているのです。

エージェント論理構造
質問1
このアーキテクチャにおいて、自律型エージェントの「脳」として機能するのは何ですか?
データベース
大規模言語モデル(LLM)
ユーザーインターフェース
質問2
複雑なプロジェクトを扱いやすいサブタスクに分割するのは、どの柱ですか?
行動
記憶
計画
チャレンジ:エージェント行動の識別
自律型エージェントのワークフローを分析してください。
AIに「ニューヨーク行きの便3件を探し、最も安いものを見つけ、上司にメールを書く」と依頼します。
ステップ1
このワークフローにおける「推論」のステップを特定してください。
解答:
推論は、エージェントが3便の料金を比較し、ユーザーの基準に基づいて最も安いものを選択するときに発生します。